Развитие искусственного интеллекта (ИИ) стало важным аспектом программы конференции LIBCOM-2024¹ Этой теме была посвящена открытая лекционно-дискуссионная панель «Искусственный интеллект в науке, культуре, образовании: проблемы, решения, привилегии».
Обсуждения коснулись особенностей применения ИИ в библиотечном деле и в образовании. Рассматривались аспекты адаптации нейросетей в библиотеках под задачи научных исследований, а также вклад ИИ в формирование новой национальной системы научно-технической информации.
¹ Организаторы конференции: Государственная публичная научно-техническая библиотека России (ГПНТБ России) и Международная ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий (Ассоциация ЭБНИТ).
ИИ В БИБЛИОТЕЧНОМ ДЕЛЕ: ВЫЗОВЫ И ПРАГМАТИКА
Рассуждая о возможностях применения ИИ в библиотечном деле, генеральный директор Российской государственной библиотеки (РГБ, «Ленинки») Вадим ДУДА начал с миссии библиотеки и её команды:
— Наша миссия — собирать, сохранять и предоставлять в доступ документы, имеющие отношение к приоритетам России. В числе долгосрочных задач «Ленинки» — повышение уровня и качества жизни коллектива. Полагаем, что команда — наше главное достояние. Для того чтобы обеспечить достойный уровень, важны доходы, и многое зависит от технологий и способов работы. Средняя заработная плата в РГБ в этом году составит 107–108 тыс. рублей, цифра удвоилась за пять лет, для чего есть определённые основания. Шесть лет назад в «Ленинке» работали 1725 человек, в этом году — 1625. Насколько уменьшился коллектив? Не на 100 человек: к нам присоединились коллектив Российской книжной палаты (РКП) и несколько проектных офисов. С учётом этого коллектив самой библиотеки сократился примерно на 400 человек, но всё происходит достаточно спокойным образом: мы совершенствуем технологии и способы работы. ИИ — один из способов радикально повысить технологичность библиотеки. Кроме того, если мы хотим оставаться источником актуальной современной информации, а не только хранилищем, близким к музею или архиву, то фонд надо пополнять современными документами, в том числе электронными. Это означает, что их количество должно возрасти. В этом мы видим возможности для ИИ.
По словам эксперта, присоединение РКП в 2022 г. обеспечило позиции РГБ как единственной настоящей национальной библиотеки, ведущей систему обязательного экземпляра (ОЭ), государственной статистики, выполняющей функции национального агентства каталогизации и распространения данных:
— Если мы хотим передать эти функции условному ИИ, это очень опасно. Надо быть осторожными и предусмотрительными: если это будет Google или другая зарубежная система, возможны осложнения. Используя какие-то модные инструменты, всегда надо думать о миссии.
Спикер обозначил основные вызовы, которые стоят перед национальной библиотекой:
— Это прежде всего радикальное изменение моделей производства и распространения актуальных знаний. Основная модель комплектования «Ленинки» — ОЭ. Но мы знаем, что в ОЭ не попадают копии веб-сайтов, страниц социальных сетей, а некоторые из них имеют несколько миллионов подписчиков. Очень высока стоимость процессов обработки данных и создания навигационных систем. В каждой библиотеке работают профессионалы, занимающиеся каталогизацией, систематизацией, созданием справочно-библиографического аппарата. В РГБ это более сложная структура. Мы поддерживаем карточный каталог и множество других вспомогательных информационных систем. В то же время стейкхолдеры: учредители и меценаты — имеют весьма прагматичные цели. Очень сложно объяснить, что нас надо поддерживать, потому что у РГБ история и традиции. Должны быть актуальные и понятные задачи прямо сейчас.
Как отметил эксперт, в основе решения задач, обусловленных этими вызовами, должен быть подход, связанный с алгоритмами и ИИ. Необходимо обрабатывать как можно больше документов, поступающих в фонд, что невозможно обеспечить лишь увеличением числа рабочих мест. В «Ленинку» каждый год поступает примерно 300 тыс. документов, примерно 150 сотрудников заняты их обработкой. Если ставить задачу обрабатывать 1,5 млн документов, то надо привлечь 1,5 тыс. человек, а это нереально.
— Перед нами стоят прагматические задачи в плане применения ИИ. Это прежде всего радикальное расширение репертуара поступлений в области цифровых документов: электронные СМИ, научные публикации, социальные сети. Много вызовов, связанных с отбором, фильтрацией, сохранением и дальнейшим использованием. Эти задачи сложно решить без применения наукоёмких инструментов. Следующая цель — автоматическая обработка и создание стабильного, нативного справочно-библиографического аппарата и машиночитаемого каталога текущих поступлений. Когда нам говорят, что «Яндекс» — некий универсальный каталог современных знаний, мы понимаем его отличие от библиотечных фондов и справочно-библиографического аппарата. Если задать специалисту-библиографу вопрос, ответ будет стабильным во времени. Этого не происходит в цифровой среде, потому что некоторые документы становятся недоступными и сами запросы серьёзно влияют на алгоритмы обработки: они создают поисковую среду и определённую систематизацию. Стабильный и нативный библиографический аппарат — это не поисковый алгоритм «Яндекса», а скорее гибрид автоматической обработки запросов и систем предметизации и систематизации, принятых в библиотечном мире. То же самое касается обработки ретроспективного массива. Если говорить о текущих поступлениях, то есть федеральный закон и мы должны получать ОЭ в электронном виде, в формате pdf. Ретроспективный фонд — это 50 млн документов, очень большая работа. Уверен, что будущее за созданием новых интерфейсов для раскрытия и интеграции документов фонда во внешние проекты, так называемые машиночитаемые каталоги. Обработка документов из библиотечных фондов должна быть двухуровневой. Сначала должна быть создана матрица ключевых слов, понятий, собственных имён, географических названий и определённых смыслов, и лишь затем формируются каталоги и справочно-библиографический аппарат, — считает В. Дуда.
Из всего этого эксперт делает вывод: если не начинать внедрять ИИ в библиотечные процессы сейчас, есть риск опоздать. Он утверждает, что ИИ становится обычным инструментом для работы, каким оказалось электричество, заменив свечи. ИИ не станет конкурентным преимуществом, как перестала быть таковым пишущая машинка. Но как полагает эксперт, можно «снять сливки» на начальном этапе: тот, кто первым пойдёт в эту сторону, имеет шанс стать монополистом или войти в олигополию. Главный поисковик в мире — Google, и вряд ли кто-то сможет назвать № 2. То же можно сказать о «Яндексе» в России. Монополия — основа цифрового бизнеса. Если мы хотим получить уверенные позиции, надо очень быстро двигаться.
В завершение гендиректор РГБ сказал:
— Что касается нормативной базы, то мы много лет пытались перенести принципы работы, существующие в физическом мире, в цифровое пространство. Именно поэтому не получилось создать надёжную среду для открытого доступа, для работы с электронными книгами. Нормативная база для работы с ИИ будет более сложной. Можно ли использовать изображение Ю. Никулина для рекламных роликов? Наверное, да. Но даже если будет запрет, системы генеративного ИИ создадут такое количество контента, что все суды окажутся парализованными. Думаю, что есть два пути решения таких проблем. Первый — этика. Должен быть подготовлен серьёзный этический кодекс работы с ИИ, очень прагматичный. Второй — субъектное, а не объектное регулирование, и вполне возможно, что появится определение цифровой свободы субъекта. Самое важное — много победителей не будет. Необходимо объединяться, для того чтобы создать конкурентоспособную среду и стать лидерами. Будущее в наших руках.
ИИ В КОНТЕКСТЕ ОБРАЗОВАНИЯ
Как отметила ректор (на ноябрь 2024 г. — Примеч. ред.) Московского государственного института культуры (МГИК) Екатерина КУДРИНА, в художественном образовании применяются различные современные технологии, в том числе связанные с ИИ: цифровые речевые инструменты, цифровая живопись и скульптура, распознавание и обработка изображений, компьютерное зрение, интеллектуальные системы обучения, чат-боты, автоматизированная оценка цифровых артефактов и т.д. При этом одним из важнейших является вопрос о том, как творческое образование может идти в ногу со временем и как выпускать инновационных и креативных работников. Важно понимать, что ИИ станет не заменой традиционному обучению, но инструментом, расширяющим его возможности. Технологии должны служить человеку, а не наоборот:
— С одной стороны, ИИ открывает огромные возможности для создания новых форм искусства, с другой — его использование несёт серьёзные угрозы. Среди них можно отметить риск формализации, особенно в системе высшего и дополнительного профессионального образования, что связано с сокращением взаимодействия с реальным преподавателем — носителем знаний и опыта по творческим специальностям. Для нас это очень серьёзная проблема, потому что данная угроза критично усиливается в связи с переходом на дистанционные формы в творческом образовании. Есть угроза технологического уклона в творческом образовании. ИИ — риск для авторского права. Мы в образовательных организациях пока «прикрываемся» тем, что используем ИИ в учебных целях, тем не менее, используя музыкальные произведения, спектакли, должны помнить об авторском праве. Ещё одна проблема, которую мы выделяем, связана с этическими аспектами и возможным уменьшением роли человека в творческих профессиях. Должны быть этические нормы, обозначенные в законодательстве.
ИИ — важное условие, для того чтобы искусство стало доступным каждому человеку вне зависимости от финансовых возможностей или места проживания, считает эксперт. Но важно не забывать о целом ряде рисков, среди которых влияние на личную свободу и творческую автономию, угроза исчезновения профессий, утрата идентичности и т.п. Необходимо комплексное развитие образовательных инициатив, создание инклюзивных и многообразных платформ, поддержка независимых творцов, соблюдение баланса между технологическим вмешательством и аутентичностью. Создание искусственных произведений с применением технологий может обогатить культуру. При этом важно учитывать ряд принципов: использовать технологию как инструмент, а не замену, как способ расширения границ с сохранением истории и культурного контекста.
Как отметила выступающая, вузы культуры и искусства представляют собой развитую сеть. В 51 вузе и 10 колледжах осуществляется подготовка кадров по 10 укрупнённым группам специальностей. 14 вузов культуры ведут подготовку кадров как многопрофильные организации, в частности МГИК ведёт одновременно подготовку более 5 тыс. студентов, реализует 53 образовательных программы полного цикла.
— Нам необходимо подготовить тех, кто будет работать с ИИ и использовать нейросети в обучении студентов, научить преподавателей, административных работников и будущих сотрудников организаций, которые будут применять средства ИИ. В связи с этим необходимо интегрировать цифровые технологии в учебные программы, осваивать платформы онлайн-обучения и видеоконференций, обеспечивать широкий доступ к учебным материалам с помощью ИИ. Онлайн-музеи, цифровые архивы произведений искусства, оцифрованные книги и статьи, использование мультимедийных инструментов для создания контента и интеграции его в учебные программы — важные направления работы. Для обеспечения эффективности образовательного процесса мы считаем необходимым проводить сравнительные исследования образовательных результатов, качественные исследования, интервью с преподавателями и студентами для оценки восприятия ими цифровых технологий, анализировать цифровой контент и платформы, а также изучать вопросы цифрового неравенства. Сегодня в МГИК создаётся рабочая группа по разработке концепции внедрения ИИ в отдельно взятом институте культуры, и возглавит её научный руководитель ГПНТБ России Я.Л. Шрайберг, — отметила Е. Кудрина.
Тему продолжила проректор Российского экономического университета Ксения ЕКИМОВА:
— ИИ сделал колоссальный шаг вперёд. Появились предобученные нейросети — не чёрный ящик, но использование объяснительного ИИ, позволяющего проследить процесс принятия решения. Каждый год мы набираем студентов из всех российских регионов, у них множество вопросов, связанных с образовательным и воспитательным процессами. Все потенциальные ответы загружены в нейросеть, которая постоянно учится и уже безошибочно отвечает.
Сегодня исследователи определили навыки, которые необходимы для освоения новых образовательных траекторий, например способность учиться и переучиваться всю жизнь. У нас есть задача от Минобрнауки России — провести оценку компетенций работников финансовых служб и проректоров по экономике российских университетов. На следующий год то же самое запланировано в отношении научных институтов. Составить тесты для финансиста, экономиста или главного бухгалтера — задача вполне решаемая при наличии определённых компетенций. Но выявить способность человека учиться, расти — дело более сложное. Во всё это погружён ИИ.
Мы используем возможности нейросетей для выстраивания индивидуальных образовательных траекторий, подготовили изменения в части магистерских программ, поскольку срок обучения по ним составляет два года и первый год чётко определён, а второй — это индивидуальное проектирование. И и генеративные нейросети у нас активно используют преподаватели Высшей школы креативных индустрий.
Что касается научных статей, докладов, выпускных квалификационных работ и даже материалов лекций, то здесь нейросеть может подвести преподавателя и создать ненужный хаос. Но в гибкости и адаптивности, в цифровизации процессов ИИ помогает. Мы провели серию семинаров-совещаний, для того чтобы актуализировать ИИ-навыки руководства университетов, собирали ректоров и проректоров. Для того чтобы ректору правильно принимать решения, основываясь на информации, полученной от проректоров, существует система дашбордов на основе ИИ, позволяющая отбирать студентов для участия в проектах, формировать списки публикаций, прогнозировать развитие системы образовательных программ. Такие системы должны быть представлены в образовательных учреждениях.
ИИ В ФОРМИРОВАНИИ НОВОЙ СИСТЕМЫ НАУЧНОЙ ИНФОРМАЦИИ
С точки зрения руководителя научного направления «Искусственный интеллект» Федерального института промышленной собственности Александра ВИСЛОГО, за последние несколько лет произошли четыре важные для развития библиотечного дела события:
— Первое — появление смартфонов, которые теперь есть у каждого. Второе — возникла некая новая сущность, которую мы называем «искусственный интеллект». Главное здесь — генеративный ИИ, который появился три-четыре года назад. С моей точки зрения, событие исключительное. Выглядит это так: идёт поток текста, неважно на каком языке. Он разбивается на фрагменты-токены. Всё это проходит через «сито» нейросети, которая разделяет поток токенов на подпотоки. Затем попадает в большой чёрный ящик, но не сплошным слоем, а разделяясь на фрагменты. Когда вы формируете запрос к ChatGPT, он разбивается по этим же правилам, а потом из всего этого собирается текст, проходя через нейросеть в обратном направлении. Основное достижение генеративного ИИ заключается в том, что этот текст а) читаемый, б) имеет смысл.
Эксперт предлагает в этом вопросе двигаться от клиента. Для большинства библиотек это учёный, преподаватель, исследователь — тот, кто приходит в библиотеку, чтобы получать научную информацию и повышать свой профессиональный уровень, обучаться. У него есть смартфон, компьютер, книги, возможность сфотографировать библиографическое описание научной статьи, где будут указаны название журнала, год выпуска, номер и т.д. Но у него нет адреса электронной почты, куда отправить это изображение, чтобы гарантированно получить копию статьи. Чтобы изменить ситуацию, библиотека должна трансформировать свои внутренние процессы. Это непросто и достаточно дорого. Когда такая библиографическая информация приходит, надо зашифровать её и определить место журнала на полке. А ещё требуется, чтобы сотрудник библиотеки дошёл до журнала со служебным смартфоном или планшетом, сфотографировал 10 страниц статьи и отправил пользователю. Это один из вариантов электронной доставки документов на современном этапе. Другой вариант — когда есть библиографическая база журналов с привязкой к библиотеке.
— Большого ИИ, для того чтобы это заработало, не нужно. У нас есть eLibrary, Электронный каталог библиотек сферы образования и науки в ГПНТБ России, АРБИКОН, где привязка статей к библиотекам уже существует. Не хватает библиотек, которые готовы оказывать эту услугу. Если мы сформулируем, что готовы как профессиональное сообщество такой механизм реализовать, то получается чёткое обоснование того, на что выделяются деньги: библиотека готова выполнить 5, 10, 20 тыс. заказов в год, это стоит столько-то. Для конечного пользователя всё будет бесплатно, а чтобы преобразовать процесс, необходимы средства государства, и где-то поможет ИИ, чтобы правильно выбрать библиотеку, связать библиографическую запись с тем местом, куда отправить запрос, — считает А. Вислый.
НЕЙРОСЕТИ И НАУЧНЫЕ ИССЛЕДОВАНИЯ
В завершение секции свою точку зрения на применение ИИ в целях научных исследований представил заведующий научной лабораторией «Цифровые технологии тарифного регулирования» РЭУ имени Г.В. Плеханова Владимир ПОДОПРИГОРА.
Одна из идей спикера — использовать нейросети для оформления научных текстов:
— Наша лаборатория образована по принципу научных дискуссий. Мы организовали постоянно действующий круглый стол «Цифровая среда». За три с небольшим года провели 86 дискуссий. Практический выход — текст, записанный в аудиоформате. Мы его научились преобразовывать в печатный вариант, но это материал неотформатированный. Когда мы его отдаём нейросети, получаем качественную структуру, и есть возможность проверить, ошибается ИИ в её формировании или нет. В памяти людей свежо обсуждение, они помнят посылы коллег. Таким образом можно вносить правки в структуру, систематизировать обсуждения. Если это поручить человеку, потребуется большое количество ресурсов.
Вторая идея связана с проведением параллелей, формированием тождеств. Как отметил эксперт, ИИ устроен по принципу человеческого мозга: нейроны обрабатывают информацию и имеют возможность обучаться. По сути дела, библиотека — это первый ИИ, а библиотекарь — перцептрон, т.е. совокупность нейронов. Он может принимать входную информацию, создавать ассоциированные представления и выдавать контент.
Третья идея — сокращение информационной асимметрии. Информационная симметрия — возможность эффективно управлять, справедливо распределять ресурсы и доходы, возможности людей для использования их талантов, навыков и знаний. В числе способов снижения асимметрии — преодоление цифрового неравенства, в том числе субсидирование доступных информационных центров на базе библиотек, МФЦ и образовательных учреждений, ликвидация информационной безграмотности. Также важно использовать ИИ для поиска, обработки и верификации информации. Если мы объединяем библиотеки и ИИ, то сразу решаем огромное количество задач: облегчаем жизнь библиотекарей и создаём общество, в котором информация открыта, доступна, а значит, оно более справедливое и стабильное.
С точки зрения спикера, возможности нейросетей в библиотеках весьма обширны:
— Первое, самое простое, — индексация и классификация книг. Кроме того, автоматический перевод. Мы работаем в полиэтническом государстве, у нас огромное количество языков. Обращение доступных материалов на русском в языки, представленные в России, — важнейшая культурная функция. Анализ читательских интересов при использовании нейросети позволяет формировать направленность библиотеки на пользователя. Обработка аудио- и видеофайлов — достаточно сложный процесс, ИИ с ним справляется гораздо быстрее, чем человек. Автоматизация выдачи материалов уже активно используется в библиотеках. Виртуальные помощники и туры: когда подборки материалов находятся в самой библиотеке, они доступны ограниченному количеству пользователей, а если сделать их публичными, гораздо больше людей познакомятся с библиотекой. Оптимизация библиотечных фондов, анализ данных и обеспечение безопасности ещё ряд функций. Графовый поиск — будущее для научных исследований. ИИ использует графовые базы данных и алгоритмы графовых вычислений для нахождения информации через связанные с конкретным документом другие источники.
Что касается проблем использования нейросетей в библиотеке, то они, по мнению эксперта, связаны с разнообразием форматов документов. Эти форматы не сопрягаются, и существуют нейросети, работающие отдельно с речью, текстом, видео и т.д. Необходимо использовать весь комплекс продуктов, но единого инструмента пока не создано. Есть проблема точности обучения нейросетей. Некорректные данные, различия в написании слов и терминов могут снизить точность и исказить результаты поиска. Здесь велика роль библиотекаря, который будет обучать собственную сеть. Существует также проблема высокой стоимости нейросетей, необходимость постоянного обновления и поддержки системы для обеспечения актуальной и адекватной работоспособности.
— Я.Л. Шрайберг утверждает, что в научных работах, в том числе в диссертациях, нейросети не могут определить новизну. Формально вроде бы могут, но верифицировать её не получается. Вообще, задачу верификации информации необходимо решать, развивая нейросети. Здесь можно было бы соединить два технологических цифровых решения. Первое — ИИ, второе — антиплагиат. Если внести тексты, которые выдают нейросети, в Антиплагиат, мы сможем определить, кому принадлежат те или иные идеи. Правда, пока Антиплагиат не умеет это делать достаточно хорошо: он выносит суждение о том, что бóльшая часть текста сгенерирована ИИ. А если бы привязать формулы и определения к конкретным исследователям, то был бы серьёзный сдвиг в системе научных публикаций.
Следует отметить, что нейросети не в состоянии провести анализ процесса, вернуться назад и внести исправление, в отличие от человека. Разработчикам необходимо создавать механизмы дискретного процесса с фиксацией каждого результата.
Междисциплинарный подход сегодня — основа любого научного исследования. Практически исчезли сферы, которые можно изучать отдельно. Необходимо обеспечить взаимосвязь между наукой и технологией, взаимодействие экспертных и непрофессиональных знаний. ИИ может решать эти задачи только с опорой на библиотеки. Поскольку библиотеки обладают широким набором знаний по разным отраслям, они с помощью ИИ в состоянии выявлять перспективные направления исследований. На мой взгляд, качество экспертных знаний в век избытка данных, колоссального объёма информации значительно снижается. Библиотеки с использованием ИИ могли бы выступить ключевыми структурами, помогающими верифицировать качество экспертных данных, — подчеркнул в завершение эксперт.
Фото с официального сайта конференции.
Рубрика: Выставки и конференции
Год: 2025
Месяц: 1
Теги: Искусственный интеллект (ИИ) LIBCOM Вадим Дуда Екатерина Кудрина Ксения Екимова Александр Вислый Владимир Подопригора